課程資訊
課程名稱
高維度數據與統計機器學習
High Dimensional Statistical Analysis and Machine Learning 
開課學期
103-1 
授課對象
理學院  應用數學科學研究所  
授課教師
李克昭 
課號
MATH5607 
課程識別碼
221 U6400 
班次
 
學分
全/半年
半年 
必/選修
選修 
上課時間
星期三1(8:10~9:00)星期五3,4(10:20~12:10) 
上課地點
天數305天數305 
備註
與陳素雲、杜憶萍合開
總人數上限:30人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1031MATH5607_HDSA 
課程簡介影片
 
核心能力關聯
本課程尚未建立核心能力關連
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

1. Dimension reduction
2. Kernel machines (kernel PCA, SVM, kernel Fisher, kernel SIR, etc.)
3. Tensor methods 

課程目標
Learn contemporary techniques for high dimensional data analysis with statistical focus.
 
課程要求
 
預期每週課後學習時數
 
Office Hours
另約時間 備註: by appointment 
指定閱讀
 
參考書目
1. High dimensional data analysis via the SIR/PHD approach. lecture notes by
K.C. Li (download at 課程內容, 第1-1週)

2. Other references for different topics will be given in class 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
class participation 
10% 
attendance, in-class discussion 
2. 
homework 
20% 
 
3. 
term project 
70% 
oral presentation and written report 
 
課程進度
週次
日期
單元主題
第10週
11/19,11/21  數學系自主學習週 (不上課)。
Submit project proposal (1-2 pages) 
第1-1週
9/17  Course overview; Grading policy (by KC) 
第1-2週
09/19  Overview for kernel methods and more (by SY); Introduction to SVD (by IP) 
第2-1週
9/24  Chapter 1. A Model for Dimension Reduction in Regression;
Chapter 2. Sliced Inverse Regression: Basics, in "sir-pHd" ebook 
第2-2週
9/26  PCA (by IP); PCA stability analysis (by SY) 
第3-1週
10/01  Sliced inverse regression 
第3-2週
10/03  PCA stability analysis (SY); PCA rank selection (IP); generalized eigenvalue problem (SY) 
第4-1週
10/08  sliced inverse regression  
第4-2週
10/10  national holiday, no class 
第5-1週
10/15  Chapter 3. Sampling properties of SIR 
第5-2週
10/17  Generalized eigenvalue problem (SY) 
第6-1週
10/22  Stein's Lemma. Linear design condition. 
第6-2週
10/24  Kernel PCA (SY) 
第7-1週
10/29  Chapter 6. Transformation and SIR 
第7-2週
10/31  Kernel PCA (SY).
Tensor methods (IP).
 
第8-1週
11/05  Chapter 7. Principal Hessian Directions. 
第8-2週
11/7  Tensor methods (IP).
Homework 5 discussion (見作業區作業觀摩). 
第9-1週
11/12  Chapter 5. Generalization of SIR: second moment based methods. 
第9-2週
11/14  檢討作業。討論期末報告相關事宜。
basic multilinear algebra, MPCA

 
第11-1週
11/26  Chapter 11. Errors in Regressors.
Chapter 14. Generalizing Fisher's LDA via the SIR approach. 
第11-2週
11/28  Basic theory of kernel induced Hilbert space. Kernel PCA, kernel LDA. 
第12-1週
12/03  Chapter 8. Linear design condition. 
第12-2週
12/05  Kernel Fisher discriminant analysis 
第13-1週
12/10  Chapter 16. Tree-structured regression via pHd.
Chapter 17. Multivariate outcome data. 
第13-2週
12/12  SVM. 張志瑋&洪仲言Kernel PCA, SVM demo. 
第14-1週
12/17  Liquid association 
第14-2週
12/19  Student oral presentations. Please prepare for a 5-10 minute presentation of project preliminary results.

Upload your slides at 作業區.
(楊剛仲丶姜慧如丶黃世豪、廖沛倫丶黃子
禎丶李杰翰、林思宏&楊同榮丶陸裕豪 請準備,其餘同學排在下週)
 
第15-1週
12/24  Factor analysis 
第15-2週
12/26  姜慧如丶陸裕豪丶黃子禎丶蔡政昱丶王俊庭、喻承俊丶蕭奕&蔡佳文&林哲宇 
第15-3週
12/27  李育誠丶林哲宇&蔡佳文&蕭奕 
第16-1週
12/31  If you need help with your projects, we will be available for discussion, 8:30-11:00 am. Please come to 天數大樓611室.  
第16-2週
2015/01/02  National holiday, no class. 
第17-1週
1/07  No class today, move to Friday. 
第17-2週
01/09  9:00 - 12:00. Final project results presentation (10 minutes for individual presentation, 15 minutes for group presentation). Upload your report to 作業區.
喻承俊、林哲宇&蔡佳文&蕭奕丶李育誠丶王俊庭丶蔡政昱、姜慧如丶陸裕豪丶林思宏&楊同榮丶黃子禎、李杰翰、廖沛倫丶楊剛仲丶張志瑋&洪仲言丶黃世豪。